AI资讯新闻榜单内容搜索-DeepSeek

DeepSeek新模型上线！引入DSA新稀疏注意力，还又狙了CUDA一枪

刚发V3.1“最终版”，DeepSeek最新模型又来了！DeepSeek-V3.2-Exp刚刚官宣上线，不仅引入了新的注意力机制——DeepSeek Sparse Attention。还开源了更高效的TileLang版本GPU算子！

来自主题: AI资讯

11168 点击 2025-09-29 19:04

HLE“人类最后考试”首次突破60分！Eigen-1基于DeepSeek V3.1显著领先Grok4、GPT-5

就在最近，由耶鲁大学唐相儒、王昱婕，上海交通大学徐望瀚，UCLA万冠呈，牛津大学尹榛菲，Eigen AI金帝、王瀚锐等团队联合开发的Eigen-1多智能体系统实现了历史性突破

来自主题: AI技术研报

9416 点击 2025-09-29 15:14

DeepSeek V3.1更新「最终版」！下一次是V4/R2了？？？

“极你太美”bug，果然在DeepSeek V3.1最新版本中被修复了。DeepSeek-V3.1刚刚更新至DeepSeek-V3.1-Terminus版本。

来自主题: AI资讯

9628 点击 2025-09-23 15:30

一家营收千亿美元的公司，如何回应 AI 落地的策略问题

2025 年 9 月 19 日，亚马逊云科技官宣：Qwen3 和 DeepSeek v3.1，首次上线 Amazon Bedrock ，正式对外提供服务，再一次引起了全球生成式 AI 市场对 Amazon Bedrock 这一产品的关注。

来自主题: AI资讯

8708 点击 2025-09-23 15:07

刚刚，阿里首个超万亿参数新王登基！Qwen3-Max屠榜全SOTA，碾压DeepSeek V3.1

阿里迄今为止，参数最大的模型诞生了！昨夜，Qwen3-Max-Preview（Instruct）官宣上线，超1万亿参数性能爆表。在全球主流权威基准测试中，Qwen3-Max-Preview狂揽非推理模型「C」位，直接碾压Claude-Opus 4（Non-Thinking）、Kimi-K2、DeepSeek-V3.1。

来自主题: AI资讯

11990 点击 2025-09-06 10:16

第一性原理视角下的MoE推理的经济学分析

随着DeepSeek R1、Kimi K2和DeepSeek V3.1混合专家（MoE）模型的相继发布，它们已成为智能前沿领域大语言模型（LLM）的领先架构。由于其庞大的规模（1万亿参数及以上）和稀疏计算模式（每个token仅激活部分参数而非整个模型），MoE式LLM对推理工作负载提出了重大挑战，显著改变了底层的推理经济学。

来自主题: AI技术研报

8939 点击 2025-09-03 11:22